Rezumat articol ediţie STUDIA UNIVERSITATIS BABEŞ-BOLYAI

În partea de jos este prezentat rezumatul articolului selectat. Pentru revenire la cuprinsul ediţiei din care face parte acest articol, se accesează linkul din titlu. Pentru vizualizarea tuturor articolelor din arhivă la care este autor/coautor unul din autorii de mai jos, se accesează linkul din numele autorului.

 
       
         
    STUDIA INFORMATICA - Ediţia nr.Sp.Issue 1 din 2009  
         
  Articol:   FEATURE SELECTION IN TEXT CATEGORIZATION USING ℓ1-REGULARIZED SVMS.

Autori:  ZSOLT MINIER.
 
       
         
  Rezumat:  Text categorization is an important task in the efficient handling of a large volume of documents. An important step in solving this task is the removal of certain features of the text that is not necessary for high precision classification. An interesting and well-founded method of feature selection are embedded methods that work directly on the hypothesis space of the machine learning algorithms used for classification. One such method is ℓ1-regularization that is used in conjunction with support vector machines. We study the effect of this method on precision of classiffying the 20 Newsgroups document corpus and compare it with the χ2 statistic feature selection method that is considered one of the best methods for feature selection in text categorization. Our findings show, that the ℓ1-regularization method performs about the same as the χ2statistic method.  
         
     
         
         
      Revenire la pagina precedentă